2月18日,DeepSeek在社交平台X上發佈了一篇關於NSA的純技術論文報告。DeepSeek稱,NSA是一種與硬體高度適配並可原生訓練的稀疏注意力機制,實現超高速長上下文訓練與推理。通過針對現代硬體的最佳化設計,NSA加快了推理速度,同時降低了預訓練成本,而不會影響性能。
與此同時,人工智慧初創公司月之暗面也有大動作。2月18日,其宣佈推出一款新模型Kimi Latest,它將對標Kimi智能助手當前使用的模型,隨智能助手產品更新而同步升級(模型名稱始終不變),使用者現已可在Kimi開放平台體驗。
市場層面,2月18日,港股DeepSeek概念股延續強勢,截至收盤,出門問問大漲超16%,創夢天地大漲超12%、美圖公司大漲超10%、快手漲超9%。高盛最新研報指出,DeepSeek-R1及中國本土AI模型的突破性進展,正在重塑科技產業敘事邏輯。
DeepSeek發佈